Hi! 大家好,我是Eric,從這篇開始將是Python的系列教學文,會先從簡單的資料視覺化開始,後續可能會練習一些機器學習(machine learn),請大家拭目以待@@
先前帶大家練習過如何用R語言畫散布圖了,這次我們要改為利用Python的matplotlib套件完成任務。

1. 載入套件。
import pandas as pd               # 資料處理套件
import matplotlib.pyplot as plt   # 資料視覺化套件
2. 載入資料。
bus = pd.read_csv("bus.csv")
bus.head(3)    # 顯示前3筆資料

3. 開始畫圖。
plt.figure(figsize=(7,5))   # 顯示圖框架大小
plt.style.use("ggplot")     # 使用ggplot主題樣式
plt.xlabel("Number of cars", fontweight = "bold")                  #設定x座標標題及粗體
plt.ylabel("Number of passengers(million)", fontweight = "bold")   #設定y座標標題及粗體
plt.title("Scatter of Number of cars and Number of passengers(million)",
          fontsize = 15, fontweight = "bold")        #設定標題、字大小及粗體
plt.scatter(bus["number of cars"],                    # x軸資料
            bus["number of passengers(million)"],     # y軸資料
            c = "m",                                  # 點顏色
            s = 50,                                   # 點大小
            alpha = .5,                               # 透明度
            marker = "D")                             # 點樣式
plt.savefig("Scatter of Number of cars and Number of passengers(million).jpg")   #儲存圖檔
plt.close()      # 關閉圖表
4. 大功告成。
圖片中每個點為每一年的資料(車輛數及載客數),可以看出資料呈現大略的正相關,也就是車輛數越多,載客數也越多
P.S. 本篇程式碼為參考台灣資料科學年會-手把手打開Python資料分析大門,並利用網路實際的開放資料執行